JSAI2026 VLM図表理解の評価データセットのスケーラブルな拡張に向けて
テーマ
既存手法を
PlantUML
を理解(評価)できるように拡張した
これまではPowerPointや手描きの
図
に対応していた
daiiz.icon
UML
はテキストで記述できるが、これをテキストとしてLLMで解釈したときと、レンダリング済みの図として提案手法のVMLで解釈したときとでは、どちらがよいか?
→ まだ比較していない
PowerPoint
データも突き詰めれば
XML
だが、たぶん図としてVMLで評価した方が適切だと思う
UMLはその気になればどちらでも解釈可能そうなので気になる
実験してみようかな
daiiz.icon
#聴講メモ